Phân tích mạng xã hội là gì? Nghiên cứu khoa học liên quan

Phân tích mạng xã hội là phương pháp nghiên cứu cấu trúc và quan hệ giữa các thực thể trong mạng bằng cách sử dụng lý thuyết đồ thị, thống kê và khoa học dữ liệu để mô tả mức độ liên kết và vai trò của từng nút. Lĩnh vực này giúp khám phá cách thông tin lan truyền, xác định mức độ ảnh hưởng và nhận diện các mô hình tương tác trong hệ thống xã hội, công nghệ hay sinh học.

Giới thiệu chung – Phân tích mạng xã hội là gì?

Phân tích mạng xã hội (Social Network Analysis – SNA) là một phương pháp nghiên cứu liên ngành nhằm mô tả, đo lường và giải thích các cấu trúc quan hệ giữa các thực thể trong mạng lưới xã hội. Các thực thể này có thể là cá nhân, nhóm, tổ chức hoặc thậm chí các đối tượng phi nhân như website, thiết bị hoặc điểm giao dịch. Phân tích dựa trên việc xem xét mạng lưới như một hệ thống các nút (nodes) và các mối liên kết (edges), từ đó nhận diện các mẫu hình tương tác và vai trò của từng nút trong cấu trúc chung. (nsf.gov)

SNA sử dụng các khái niệm và công cụ từ lý thuyết đồ thị, thống kê, khoa học dữ liệu và khoa học xã hội. Bằng cách định lượng hóa các mối quan hệ, SNA cho phép nghiên cứu quá trình lan truyền thông tin, mức độ ảnh hưởng, sự hình thành cộng đồng và các cơ chế tương tác phức tạp trong xã hội hiện đại. Các nền tảng số như Facebook, Twitter, LinkedIn càng làm cho SNA trở nên quan trọng nhờ khối lượng lớn dữ liệu mạng người dùng.

Nghiên cứu SNA giúp giải thích hiện tượng xã hội theo hướng cấu trúc thay vì chỉ dựa vào đặc điểm cá nhân. Mạng lưới được xem như yếu tố quyết định hành vi, vị thế và quyền lực của các thành viên. Các nhà khoa học sử dụng SNA để phân tích tin giả, lan truyền dịch bệnh, cấu trúc chính trị, mô hình kinh tế và hành vi tiêu dùng.

Cơ sở lý thuyết và khái niệm nền tảng

Nền tảng lý thuyết của SNA dựa trên mô hình mạng gồm hai thành phần chính: nút và cạnh. Nút đại diện cho tác nhân xã hội (người, tổ chức), còn cạnh biểu thị mối liên kết như giao tiếp, hợp tác, giao dịch hoặc chia sẻ thông tin. Các mạng có thể là có hướng hoặc vô hướng, có trọng số hoặc không trọng số tùy thuộc vào tính chất quan hệ. (sciencedirect.com)

Các chỉ số quan trọng trong SNA bao gồm độ trung tâm (centrality), độ phân cụm (clustering), mật độ mạng (density) và khoảng cách mạng (path length). Độ trung tâm trung gian, chẳng hạn, đo lường mức độ một nút đóng vai trò "cầu nối" trong mạng, được tính bằng công thức sau: CB(v)=svtσst(v)σstC_B(v)=\sum_{s \neq v \neq t} \frac{\sigma_{st}(v)}{\sigma_{st}} trong đó σst \sigma_{st} là số đường đi ngắn nhất giữa s và t, và σst(v) \sigma_{st}(v) là số đường đi ngắn nhất có đi qua nút v. Công thức này giúp xác định nút có vai trò điều phối luồng thông tin trong mạng.

Các khái niệm như structural holes (khoảng trống cấu trúc), community detection (phát hiện cộng đồng), homophily (sự tương đồng) hay tie strength (độ mạnh liên kết) giúp mô tả sự khác biệt giữa các dạng mạng xã hội. Từ đó, SNA cung cấp cách hiểu sâu sắc về sự phân tầng và động lực tương tác trong các nhóm xã hội.

Dữ liệu và thu thập dữ liệu trong phân tích mạng xã hội

Dữ liệu mạng xã hội được thu thập từ nhiều nguồn khác nhau như khảo sát định tính, phỏng vấn, dữ liệu từ nền tảng truyền thông số, cơ sở dữ liệu giao dịch hoặc hệ thống cảm biến. Chất lượng phân tích phụ thuộc vào độ đầy đủ, chính xác và mức độ biểu diễn quan hệ của dữ liệu. Các nghiên cứu quy mô lớn thường sử dụng dữ liệu mạng thu thập qua API như Twitter API hoặc Meta Graph API. (pewresearch.org)

Dữ liệu thu thập có thể bao gồm: danh sách bạn bè, tương tác bài viết, tin nhắn, lượt thích, chia sẻ, thẻ gắn (tags) hoặc dòng thời gian hoạt động. Các dạng dữ liệu này được chuyển đổi thành ma trận kề (adjacency matrix) hoặc danh sách cạnh (edge list) để phục vụ phân tích.

Quá trình thu thập dữ liệu phải tuân thủ các nguyên tắc đạo đức, bảo mật thông tin cá nhân và các quy định pháp lý như GDPR hoặc chính sách quyền riêng tư của từng nền tảng. Điều này đặc biệt quan trọng trong bối cảnh dữ liệu mạng xã hội chứa nhiều thông tin nhạy cảm.

  • Dữ liệu định tính: phỏng vấn, quan sát, ghi nhận mối quan hệ.
  • Dữ liệu định lượng: số lượng tương tác, tần suất giao tiếp.
  • Dữ liệu lớn: hàng triệu quan sát từ nền tảng trực tuyến.

Các chỉ số phân tích chính

Các chỉ số định lượng trong SNA cho phép mô tả cấu trúc mạng một cách toàn diện. Độ trung tâm bậc (degree centrality) đo số lượng liên kết trực tiếp, được tính bằng công thức: CD(v)=deg(v)n1C_D(v)=\frac{deg(v)}{n-1} trong đó deg(v)deg(v) là số cạnh nối với nút v và n là tổng số nút. Chỉ số này giúp xác định nút nào có nhiều quan hệ trực tiếp nhất.

Độ trung tâm gần (closeness centrality) đo lường mức độ nút tiếp cận nhanh với tất cả nút khác trong mạng thông qua đường đi ngắn nhất. Độ trung tâm trung gian (betweenness centrality) cho thấy mức độ một nút kiểm soát luồng thông tin. Hệ số phân cụm (clustering coefficient) đo lường mức độ các nút láng giềng có xu hướng kết nối với nhau, phản ánh cấu trúc cộng đồng.

Để hỗ trợ quá trình phân tích, các bảng tổng hợp sau đây giúp minh họa nhóm chỉ số SNA phổ biến:

Chỉ số Mục đích Ý nghĩa
Degree Centrality Đo số liên kết trực tiếp Xác định nút có ảnh hưởng tức thời
Betweenness Centrality Đo vai trò cầu nối Nhận diện nút kiểm soát luồng thông tin
Closeness Centrality Đo khoảng cách trung bình Đánh giá khả năng tiếp cận toàn mạng
Clustering Coefficient Đo mức độ tập trung của nhóm Nhận diện cộng đồng hoặc mạng nhỏ

Phương pháp và thuật toán phân tích

Phân tích mạng xã hội bao gồm nhiều phương pháp và thuật toán nhằm hiểu rõ cấu trúc và động lực của mạng. Một trong những nhóm thuật toán quan trọng nhất là thuật toán phát hiện cộng đồng (community detection), giúp xác định các nhóm nút liên kết chặt chẽ với nhau hơn so với phần còn lại của mạng. Thuật toán Louvain hoạt động bằng cách tối ưu hóa độ modularity để tìm các cụm tự nhiên trong mạng, thích hợp cho dữ liệu lớn. Thuật toán Girvan–Newman dựa trên việc loại bỏ các cạnh có độ trung gian cao, từ đó phân tách dần mạng thành các cộng đồng nhỏ. (acm.org)

Các thuật toán lan truyền ảnh hưởng sử dụng trong SNA mô phỏng cách thông tin, hành vi hoặc dịch bệnh lan rộng qua mạng. Mô hình Independent Cascade mô tả quá trình một nút bị ảnh hưởng có xác suất truyền ảnh hưởng sang các nút láng giềng theo thời gian rời rạc. Trong khi đó, mô hình Linear Threshold giả định mỗi nút bị ảnh hưởng khi tổng ảnh hưởng từ các láng giềng vượt một ngưỡng nhất định. Những mô hình này được ứng dụng rộng rãi trong marketing lan truyền, nhận diện lan truyền tin giả và nghiên cứu lan truyền dịch tễ.

Dự đoán liên kết (link prediction) là phương pháp quan trọng giúp ước tính khả năng hình thành quan hệ mới trong mạng. Các phương pháp đơn giản dựa trên sự tương đồng cấu trúc như Common Neighbors, Adamic–Adar hoặc Jaccard Index; trong khi các phương pháp hiện đại sử dụng mô hình học sâu trên đồ thị như Graph Neural Networks (GNN). Những kỹ thuật này được áp dụng trong đề xuất kết nối bạn bè, phát hiện giao dịch bất thường và phân tích mạng sinh học.

Ứng dụng trong khoa học xã hội và nhân văn

Trong khoa học xã hội, SNA cung cấp công cụ mạnh mẽ để phân tích cấu trúc quyền lực, ảnh hưởng xã hội và quá trình hình thành dư luận. Các nhà nghiên cứu sử dụng SNA để khảo sát cách thông tin lan truyền trong cộng đồng, xác định những cá nhân có sức ảnh hưởng cao (influencers), và khám phá cấu trúc các mạng tương tác trong trường học, cơ quan hoặc cộng đồng dân cư. Những phân tích này hỗ trợ hiểu rõ cách hình thành chuẩn mực xã hội, hành vi tập thể và xung đột nhóm.

Trong truyền thông, SNA giúp theo dõi sự lan truyền tin tức, tin giả (misinformation) và xác định các điểm nóng (hotspots) trong dòng chảy thông tin. Khi một sự kiện lớn xảy ra, phân tích cấu trúc mạng chia sẻ và bình luận có thể giúp nhận diện các nguồn phát tán nhanh nhất hoặc xác định sự lan truyền đa tầng qua các nền tảng truyền thông xã hội. (pewresearch.org)

Trong khoa học chính trị, SNA được dùng để nghiên cứu mạng lưới vận động hành lang, cấu trúc quyền lực, liên minh chính trị và mô hình phân cực. Mối quan hệ giữa các chính trị gia, tổ chức và nhóm lợi ích được biểu diễn dưới dạng mạng giúp giải thích hành vi biểu quyết, xu hướng liên kết và khả năng lan truyền ý kiến. Điều này cung cấp cơ sở khoa học cho việc hoạch định chính sách và đánh giá hiệu quả cấu trúc thể chế.

Ứng dụng trong khoa học dữ liệu và công nghệ

Nhiều hệ thống khuyến nghị (recommendation systems) sử dụng SNA như một thành phần quan trọng. Dựa vào mạng quan hệ giữa người dùng và sản phẩm, mô hình đồ thị có thể dự đoán sở thích cá nhân, đề xuất kết nối xã hội hoặc gợi ý nội dung. Điều này xuất hiện trong các nền tảng như YouTube, TikTok, Facebook và LinkedIn. Các thuật toán phân tích mạng cũng được dùng để phát hiện cộng đồng người dùng nhằm tối ưu hóa chiến dịch quảng cáo và marketing hướng đối tượng.

Trong an ninh mạng, SNA hỗ trợ phát hiện các mẫu tấn công được ngụy trang dưới dạng hành vi bình thường bằng cách phân tích cấu trúc mạng giao tiếp. Các nút bất thường, thường đại diện cho mã độc hoặc botnet, có các đặc trưng cấu trúc mạng khác biệt so với người dùng thông thường. Nhiều phương pháp học máy trong an ninh mạng hiện dựa vào phân tích đồ thị để phát hiện mối đe dọa. (ieee.org)

Phân tích mạng cũng được dùng trong khoa học sinh học để nghiên cứu mạng tương tác protein, mạng gene hoặc mạng trao đổi chất. Những mạng này biểu thị cấu trúc chức năng của hệ sinh học và giúp nhận diện các gene quan trọng hoặc điểm điều hòa chính trong tế bào. Điều này hỗ trợ phát triển thuốc và kỹ thuật điều trị nhắm mục tiêu.

Thách thức trong phân tích mạng xã hội

Một thách thức quan trọng của SNA là thu thập dữ liệu đầy đủ và chính xác. Dữ liệu thiếu hoặc sai lệch về quan hệ có thể làm giảm chất lượng phân tích vì mạng xã hội phụ thuộc mạnh vào cấu trúc. Ngoài ra, mạng xã hội thực rất phức tạp, đa tầng, thay đổi theo thời gian nên việc mô hình hóa dữ liệu luôn gặp nhiều hạn chế.

Vấn đề đạo đức và quyền riêng tư là rào cản lớn. Nhiều mạng xã hội chứa thông tin nhạy cảm như vị trí, danh tính hoặc lịch sử tương tác; việc thu thập và phân tích phải tuân thủ các quy định như GDPR, CCPA hoặc các chính sách riêng tư của nền tảng. Vi phạm có thể gây hệ lụy nghiêm trọng cho cá nhân và tổ chức.

Khả năng diễn giải kết quả cũng đặt ra thách thức, đặc biệt khi các thuật toán hiện đại sử dụng mô hình học sâu trên đồ thị có tính “hộp đen”. Điều này khó giải thích với nhà hoạch định chính sách hoặc công chúng, yêu cầu phát triển các mô hình giải thích được (explainable AI) trong phân tích mạng.

Kết luận

Phân tích mạng xã hội là một phương pháp mạnh mẽ giúp giải thích cấu trúc và động lực của các hệ thống xã hội, công nghệ và sinh học. Bằng cách kết hợp lý thuyết đồ thị, thống kê và khoa học dữ liệu, SNA mang lại khả năng phân tích sâu về ảnh hưởng, hành vi và dòng chảy thông tin. Các ứng dụng của SNA trải rộng từ khoa học xã hội, truyền thông, chính trị đến công nghệ, an ninh mạng và sinh học phân tử.

SNA tiếp tục phát triển mạnh mẽ trong thời đại dữ liệu lớn, mở ra triển vọng quan trọng cho hiểu biết xã hội và phát triển công nghệ trong tương lai. Tuy nhiên, việc khai thác SNA phải đi kèm với việc tuân thủ các nguyên tắc đạo đức và đảm bảo quyền riêng tư của người dùng.

Tài liệu tham khảo

  • National Science Foundation – Social Network Analysis Overview. (nsf.gov)
  • ScienceDirect – Social Network Analysis. (sciencedirect.com)
  • Pew Research Center – Social Media Users. (pewresearch.org)
  • ACM Digital Library – Community Detection Algorithms. (acm.org)
  • IEEE Xplore – Network Analysis Applications in Cybersecurity. (ieee.org)

Các bài báo, nghiên cứu, công bố khoa học về chủ đề phân tích mạng xã hội:

Chủ Nghĩa Tự Phục Vụ và Các Trang Web Mạng Xã Hội Dịch bởi AI
Personality and Social Psychology Bulletin - Tập 34 Số 10 - Trang 1303-1314 - 2008
Nghiên cứu hiện tại đã xem xét cách thức chủ nghĩa tự phục vụ được thể hiện trên một trang web mạng xã hội (tức là Facebook.com). Các báo cáo tự đánh giá về nhân cách có tính tự phụ được thu thập từ những người sở hữu trang mạng xã hội. Sau đó, các trang web của họ được mã hóa theo cả các đặc trưng nội dung khách quan và chủ quan. Cuối cùng, những người lạ đã xem các trang web và đánh giá ấn tượng... hiện toàn bộ
#chủ nghĩa tự phục vụ #mạng xã hội #Facebook #phân tích nội dung #ấn tượng xã hội
Khám phá các mẫu đồng tác giả trong khoa học xã hội của Việt Nam với các chỉ số mạng cơ bản từ dữ liệu Scopus 2008-2017. Dịch bởi AI
F1000Research - Tập 6 - Trang 1559 - 2017
Bối cảnh: Hợp tác là một hiện tượng phổ biến trong giới khoa học Việt Nam; tuy nhiên, những hiểu biết về sự hợp tác khoa học của Việt Nam vẫn còn hạn chế. Mặt khác, việc áp dụng phân tích mạng xã hội trong nghiên cứu hợp tác khoa học đã thu hút được nhiều sự chú ý trên toàn thế giới. Kỹ thuật này có thể được sử dụng để khám phá cộng đồng khoa học Việt Nam. Phương pháp: Bài báo này sử dụng lý thuyế... hiện toàn bộ
#Social network analysis #network characteristics #network visualization #research output. #science collaboration
Bạn Có Đang Sử Dụng Nền Tảng Đúng? Phân Tích Hợp Đồng Về Sở Thích Mạng Xã Hội Ở Bệnh Nhân Phẫu Thuật Thẩm Mỹ Dịch bởi AI
Aesthetic Surgery Journal - Tập 39 Số 9 - Trang 1019-1032 - 2019
Tóm tắt Thông Tin Nền Mạng xã hội đã trở thành một công cụ không thể thiếu giúp bệnh nhân tìm hiểu về phẫu thuật thẩm mỹ. Hiện tại, sở thích của bệnh nhân đối với các nền tảng mạng xã hội và nội dung cụ thể cho từng thủ tục vẫn chưa được biết đến. Mục Tiêu Các tác giả mục tiêu đánh giá sở thích sử dụng mạng xã hội của bệnh nhân tìm kiếm phẫu thuật thẩm mỹ. Phương Pháp Chúng tôi đã sử dụng một cuộc... hiện toàn bộ
#phẫu thuật thẩm mỹ #mạng xã hội #sở thích bệnh nhân #phân tích hợp đồng #phương pháp nghiên cứu
Phân tích hình ảnh cái tôi của sinh viên qua facebook cá nhân và đưa ra một vài kiến nghị cho công tác hỗ trợ sinh viên xây dựng thương hiệu cá nhân trên mạng xã hội
Tạp chí Khoa học Trường Đại học Sư phạm Thành phố Hồ Chí Minh - Tập 15 Số 5 - Trang 151 - 2019
Bài viết đề cập hình ảnh cái tôi (HACT) của sinh viên (SV) qua facebook (FB) cá nhân. Cấu trúc HACT của SV qua FB cá nhân có 7 mặt: HACT -  nhận diện bề ngoài, HACT - xã hội, HACT -cảm  xúc, HACT  -  tương lai, HACT  -  năng lực, HACT  -  tính cách và HACT  -  hưởng thụ  -  trải nghiệm. Qua FB cá nhân, HACT của SV được thể hiện với mức độ đậm nhạt khác nhau. Nhìn chung, HACT  -  xã hội và HACT  - ... hiện toàn bộ
#hình ảnh cái tôi #facebook #mạng xã hội #hỗ trợ sinh viên #sinh viên
Phát hiện cộng đồng trong mạng xã hội Dịch bởi AI
Data Mining and Knowledge Discovery - Tập 24 - Trang 515-554 - 2011
Bài khảo sát đề xuất thảo luận chủ đề phát hiện cộng đồng trong bối cảnh Mạng xã hội. Phát hiện cộng đồng là một công cụ quan trọng cho việc phân tích các mạng lưới phức tạp, cho phép nghiên cứu các cấu trúc mesoscopic thường liên quan đến các đặc điểm tổ chức và chức năng của các mạng lưới cơ sở. Phát hiện cộng đồng đã chứng minh giá trị của nó trong nhiều lĩnh vực, chẳng hạn như sinh học, khoa h... hiện toàn bộ
#phát hiện cộng đồng #mạng xã hội #phân tích mạng #thuật toán #khai thác dữ liệu
Nhận định những rủi ro chính khi thi công nhà cao tầng trong giai đoạn ngầm khi áp dụng phân tích mạng lưới xã hội Social Network Analysis (SNA)
TẠP CHÍ VẬT LIỆU & XÂY DỰNG - Tập 13 Số 02 - Trang Trang 79 - Trang 83 - 2023
Thi công tầng ngầm rất phức tạp, chứa tiềm ẩn nhiều rủi ro khác nhau. Sự cố công trình luôn là điều đáng tiếc gây thiệt hại to lớn về tính mạng, tài sản, công sức của mọi người. Phần ngầm quan trọng của công trình chính là tường vây, tường vây được hiểu là phần kết cấu dưới lòng đất vây xung quanh công trình. Công tác quản lý rủi ro khi thi công tường vây là công tác quan trọng, giúp nhà thầu chủ ... hiện toàn bộ
#Rủi ro #Quản lý dự án #Quản lý xây dựng
Các địa điểm của ngành công nghiệp âm nhạc Đức trong các mạng lưới sản xuất âm nhạc toàn cầu Dịch bởi AI
Standort - Tập 47 - Trang 106-112 - 2023
Âm nhạc phổ biến hình thành trong các mạng lưới sản xuất phức tạp, nơi mà các tổ chức khác nhau và các tác nhân chuyên môn cao cùng tương tác. Các phòng thu âm đóng vai trò là những địa điểm mà các tác nhân này tập hợp, trở thành trung tâm sáng tạo âm nhạc. Các chuyển động ảo và vật lý giữa các phòng thu âm kết nối các thành phố trên toàn cầu và từ đó hình thành nên các mạng lưới sản xuất âm nhạc ... hiện toàn bộ
#ngành công nghiệp âm nhạc #mạng lưới sản xuất #phòng thu âm #thị trường âm nhạc #phân tích mạng xã hội
Quân đội mạng trong điều tra hình sự mẫu trên mạng xã hội Dịch bởi AI
Springer Science and Business Media LLC - Tập 78 - Trang 7749-7767 - 2022
Quân đội mạng trong việc thao túng ý kiến công chúng đã trở thành một vấn đề nhức nhối được bàn luận rộng rãi. Quy trình hoạt động và các chi tiết về cách mà quân đội mạng tác động lên suy nghĩ của con người chưa được làm rõ. Mô hình nghiên cứu của chúng tôi kết hợp các thuật toán tính toán và các phương pháp thống kê từ góc độ tổng thể và vi mô để phân tích các hệ thống hoạt động nhúng và ảnh hưở... hiện toàn bộ
#quân đội mạng #thao túng ý kiến #nghiên cứu xã hội #Đài Loan #mạng xã hội #phân tích thống kê
Tiles: Một Thuật Toán Trực Tuyến Để Khám Phá Cộng Đồng Trong Các Mạng Xã Hội Năng Động Dịch bởi AI
Machine Learning - Tập 106 - Trang 1213-1241 - 2016
Khám phá cộng đồng đã nổi lên trong suốt thập kỷ qua như một trong những vấn đề thách thức nhất trong phân tích mạng xã hội. Nhiều thuật toán đã được đề xuất để tìm kiếm các cộng đồng trên các mạng tĩnh, tức là các mạng không thay đổi theo thời gian. Tuy nhiên, mạng xã hội là những thực thể năng động (ví dụ: đồ thị cuộc gọi, mạng xã hội trực tuyến): trong những kịch bản như vậy, việc khám phá cộng... hiện toàn bộ
#Khám phá cộng đồng #Mạng xã hội năng động #Thuật toán trực tuyến #Cộng đồng chồng chéo #Phân tích mạng xã hội
Tổng số: 28   
  • 1
  • 2
  • 3